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Для моделирования в классе авторегрессионных уравнений разработан критерий регулярности 
МГУА с разбиением наблюдений на обучающие и проверочные подвыборки в условиях 
квазиповторных наблюдений. Доказано существование оптимального множества регрессоров. 
Получено условие редукции оптимальной авторегрессионной модели, которое зависит от 
параметров авторегрессионной модели и объёмов выборок. 
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режень. Доведено 1снування оптимально! множини регресор!в. Встановлено умову редукцй опти- 
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Ключов! слова: невизначенсть за складом регресортв, критерий регулярност1. 


Определение порядка авторегрессионной модели в условиях структурной 
неопределённости по количеству и составу регрессоров является важной задачей 
в теории идентификации, и для её решения существуют различные подходы [1-7]. 
Эта задача является одним из объектов исследования в методе группового учета 
аргументов (МГУА) [8-12], который разработал академик НАН Украины 
А.Г. Ивахненко. Подход основан на разбиении выборки наблюдений на 
обучающую и проверочную части: на обучающей выборке оцениваются 
коэффициенты модели, ана проверочной оценивается качество модели. В 
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соответствии с принципами моделирования в МГУА для того, чтобы построить 
авторегрессионное уравнение оптимальной сложности, необходимо: а) указать 
метод оценивания коэффициентов в авторегрессионном уравнении; 6) задать 
алгоритм генерирования авторегрессионных уравнений (структур моделей); 
в) разработать внешний критерий для оценки качества перебираемых структур; 
г) исследовать поведение математического ожидания внешнего критерия в 
зависимости от состава регрессоров; д) доказать существование авторегрес- 
сионной модели оптимальной сложности. При моделировании в классе 
авторегрессионных уравнений в МГУА традиционно применяется критерий 
регулярности: обучающая выборка формируется первыми и(А) наблюдениями 


временного ряда, проверочная выборка последующими и(В) наблюдениями, 
причём выполняется ип(А)+п(В)=п, где п- объём исходной выборки. 


Применение критерия регулярности в таком виде требует контроля, поскольку 
динамические свойства объекта могут проявляться неодинаково на разных фазах 
переходных процессов. 

В данной работе предлагается рассчитывать критерий регулярности в так 
называемой схеме квазиповторных наблюдений, которая возможна в условиях 
активного эксперимента. В этой схеме обучающая (А) и проверочная (В) 
выборки получены особым способом как пара реализаций функционирования 
объекта с близкими начальными условиями, качественно одинаковым характером 
переходных процессов и близкими состояниями в конечные моменты времени. 


Априорные предположения об объекте 


Пусть функционирование динамического объекта подчиняется закону в виде 
авторегрессионного уравнения 


* Г * : * * Я 

м1 (о 

Х2 6 
Ри ны @) 
хм и 

ы ей 

Хх» . | И 


которое в матрично-векторной форме можно записать в виде: 


* * о 
х=(р)0+6(-1, (2) 
* 
где х — ненаблюдаемый (пх1)-вектор значений выходной переменной объекта в 
дискретные моменты времени 1[=&, 1=1,2.....п; п — общее число наблюдений; 


р — число предыдущих значений выходной переменной, которые влияют на её 


* 
текущее значение; 7(р)- (пхр)-матрица р предыдущих ненаблюдаемых 
значений переменной, в обозначении этой матрицы р означает, что в (1)—(2) при 


* 


о 
формировании величины х; участвуют величины (х;,х;›,....Х;_›); 9 — (рхП- 


вектор неизвестных детерминированных коэффициентов; 6(—1) — ненаблюдаемый 
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случайный (пх])-вектор, в обозначении которого ”—1” означает, что в (1)-(2) при 
формировании величины х, аддитивно участвует величина (; |. 

В (1) - (2) предполагается, что в формировании текущего значения выход- 
ной переменной участвуют все р её предыдущих значений. В общем случае не 
все её предыдущие значения могут участвовать в этом формировании. Для записи 
моделей в общем случае введем структурные матрицы, смысл которых покажем 
на примере. Пусть на текущее значение выходной переменной влияют первое, 
второе и четвертое её предыдущих значения из максимально заданного 


возможного числа влияющих предыдущих значений р=5. Тогда вместо матрицы 
* 
(р) в (Г)-(2) следует записать произведение матриц 
Г * г ож г * г ж Я] Г * г Г * 7 
Хо ЕЛ Е Х2 Е Хз Ха РАО] хо Х-1 Х-3 
В а 1:0:0 а - * 
Хх! х 0 1 0 Хх хо Х-2 
р ых 0 ОЕ | С › (3) 
0:0:1 х- 
И Е а 
Хп-1 ! Хи-2 : Хи-3 1 Хи—4 ! З [ Хи-1 : Хи-2 : Хи-4 | 


где (5х3)-матрица $ представляет собой структурную матрицу, отражающую 
влияние первого, второго и четвертого предыдущих значений переменной на её 
текущее значение. Априорная информация о значении р и о том, какие именно 
предыдущие значения определяют текущее значение переменной в законе 
функционирования объекта (1)—(2), представляется структурной (рхт) -матри- 
цей $ (т - число столбцов в матрице $ , которое равно числу неизвестных коэф- 
фициентов в модели). Будем пока предполагать, что эта структурная матрица 
задана. 

С учетом введенной структурной матрицы закон функционирования (2) для 
общего случая формирования выходной переменной запишем в виде 


* * о 


х=7(р)5$ 0+ (0 =х+6(П, (4) 


т = 

где 09 - (тх)-вектор неизвестных детерминированных коэффициентов; х — 

ненаблюдаемая составляющая (пх1)-вектора значений выходной переменной. 
Пусть для наблюдений выходной переменной объекта выполняется 


* 
х=х,;+8,, 1=1.2,...П, (5) 
* 


где х- наблюдаемое значение переменной в момент времени Г=Е, х- 


ненаблюдаемое значение; &, — случайная ненаблюдаемая ошибка измерения 
переменной. 
Запишем с учетом (5) модель наблюдения объекта в векторной форме 
хЕХ+еЕ. (6) 
Пусть относительно 6(—1) выполнено 
т 
Е} =0,, Е06 (-П}=5 1. (7) 
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где Е{}- знак математического ожидания по возможным реализациям 
случайного вектора 6(—1); 0,- (пх-вектор, состоящий из нулей; вс — 
дисперсия величины (,(—1), 1=1,2,...,п, ограниченная величина; Г, — единичная 
(пхп) -матрица. 


Пусть относительно = выполнено 
Е {Е} =0,, Е{ЕЕ }=0. 1, (8) 
где Е{}- знак математического ожидания по возможным реализациям 
случайных векторов &; о, — дисперсия величины &,, [=1,2,...,И, ограниченная 
величина. 

Пусть в результате наблюдения в моменты времени ЕЕ, 
1=1-2р,2—2р,...,0,1,2,....п, получен (п+2р)-вектор значений выходной 
переменной объекта 

т _[ х(0) 
О 2—2 р»... > 0» М1, Хо, х, ) = а (9) 
где (2рх-вектор х(0) будет использован в качестве начальных условий. 

Пусть заданы: 1) р — число предыдущих значений выходной переменной, 
которые влияют на её текущее значение; 2) структурная (рхт) -матрица $, 


которая определяет, какие именно предыдущие значения переменной определяют 
её текущее значение. 


о 
Для оценивания неизвестных коэффициентов 9 по наблюдениям объекта (9) 
используем результаты [13-14], где разработаны итерационные процедуры 
параметрической идентификации для системы авторегрессионных уравнений. 


Оценивание коэффициентов в авторегрессионном уравнении 
Для (их!) -вектора х выполняется 
= (6) 
х= (р) 0+ 5(^), (10) 
где матрица 7(р)- (пхр)-матрица ненаблюдаемых значений переменной 


* 


объекта, по своей структуре она аналогична матрице 7(р) в (1)(2): 


хо Х-1 Х1-р 
р)=| м 0 с дю, 0 
[Хи-р Хи-2 ' Хи-р| 


5 — случайный (их1)-вектор с нулевым математическим ожиданием 


Е==+Г(-2;2)$0+6(-0,, Е {6} =0,; (12) 


Г(-2;7) — (их р)-матрица ненаблюдаемых случайных величин 
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р Бы 9 
Г(-2;:2)= о И С У» (13) 
С,—2 3 О 
Введем обозначения 
у=х, В-7(р)5, (14) 


где В - (ихт) -матрица регрессоров для выходной переменной. 
Учитывая (14), регрессионную модель (10) запишем в виде 


У=ВО+ЕУЧЕ, (15) 


ге у- (1х)-вектор наблюдаемых зашумленных значений выходной 


[о [е) 
переменной; у- (пх!-вектор ненаблюдаемых значений; 0 -— (тх|-вектор 


неизвестных коэффициентов; & —(пх]!) -вектор ненаблюдаемых случайных 
аддитивных составляющих. 
[е) 
Согласно [13], для оценки коэффициентов 9 выполняется 

^ 

а=Су, (16) 
где для (тхп)-матрицы С выполняется 

С=(В'ЕВ) ВУ, (17) 


а У. ковариационная (пхп)-матрица введённого в (15) (пх!)-вектора 
ненаблюдаемых аддитивных случайных составляющих &. 
Для ковариационной матрицы Х, выполняется [13]: 

ХЕ=с, 1, +Ч+ое Ш, (18) 

где о, - дисперсия в модели наблюдения, введённая в (8); с: — дисперсия в 


модели функционирования, введённая в (7); 4 — (пихп)-матрица имеет вид 


Г %(0) (+0 у(р-й 0 0 0 
У(-0 (0) у(р-2) ч(р-П 0 0 
ти У(-р) \(2-р) (0) УСО 0 (19) 
0 У(-р) %(-1) (0) 0 
0 0 0 0 (0) у(+1) 
0 0 0 0 %(-0 (0) | 


В (19) величины (А), А=-р+1-р+2,...р-2,р-1, определяются по 


формулам 


(д) = Соу{5:5,, } =о: 0 75" КА -ь)50, 


(20) 


где Г,(-Ь)- (рхр)-матрица, у которой все элементы равны нулю, кроме 


элементов одной диагонали, равных единице: если Л=й-& =0, то это главная 
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диагональ; если А> 0, то это диагональ, расположенная выше главной диагонали 
на Л строк; если д < 0, то это диагональ, расположенная ниже главной диагонали 
на || строк. 


С учетом (17)-(20) для оценок коэффициентов выполняется 
4=(В'`У В) ВХ у. (21) 
В формулу (17) для матрицы С входит ненаблюдаемая матрица регрессоров 


В, ав формулу (18) для матрицы УХ. - матрица 4, элементы которой, как 

[е) 
следует из (19)-(20), зависят от неизвестных коэффициентов 0. Эти 
обстоятельства используем для построения итерационной процедуры вычисления 
неизвестных коэффициентов в виде (21). 


^ 
Пусть матрица В(’-1) — оценка матрицы регрессоров В, полученная на 


^ о) 
итерации с номером г’-—1; (г) — оценка вектора коэффициентов @ в виде (21), 


полученная на итерации с номером Г. Тогда для регрессионной модели (15) 
выполняется 


у=Ве- Ва чи=УФчиа, (22) 


^ 

где у(г)- (их,)-вектор выходов, ч(г)- (их )-вектор остатков [15] 
регрессионной модели. 

Итерационная процедура вычисления неизвестных коэффициентов в виде 
(16)—(17) предусматривает три этапа. 

Этап 1. Начальное приближение. 

Шаг 1. Формируем матрицы наблюдаемых предыдущих значений переменных 

(аналогично (11)) 


Хх Хх в. Хр 
х Хх в. Х> р 
2(Р0)= (23) 
оО. 
| Ха-1 Хи *”. Хр 
Шаг 2. Формируем матрицы наблюдаемых регрессоров (аналогично (14)) 
В(0) = 7(р:;0)$. (24) 


Шаг 4. Полагаем 4 =О,„,„ - нулевая (пхп) -матрица. 


Шаг 5. Вычисляем оценку коэффициентов: 
—1 
9(0) = [ВОГ Го, -1, +ос 1,1 В(0) [В (ОГ Го, -1, +ос ГУ. (25) 


Шаг 6. Вычисляем выходы моделей: 


у(0)=В(0) а). (26) 


Шаг 7. Вычисляем остатки моделей: 
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и(0)=У-У(0). (7) 
Шаг 8. Вычисляем целевой функционал: 
Ф(0)=((п-1 "и" (0)и(0))"?. (28) 


Этап П. На итерациях и =1,2...., ’’ выполняем такие операции: 
Шаг 1. Формируем матрицы оценок предыдущих значений (аналогично (11)) 


р Е Се д, 

7("-Ю  (- +: у@-9 
Ирг-=|, ‘ о Вий (29) 

о У-(т-П 

о У *° 5 -О 

Шаг 2. Формируем матрицы регрессоров (аналогично (14)) 

В(и-1=7(р;г-1Ъ. (30) 
Шаг 4. Рассчитываем матрицу Уи) = величины и(А; 7—1), 
АРЬЕ. ‚—1,0,1,....р-2,р-1 вычисляем по формулам (35)-(36), 


[е) ^ 
используя в качестве оценок 9 приближения 4(’-Т), полученные на итерации 


^ 
"—1; на итерации г =1 используем оценки начального приближения 4(0) в (25). 
Шаг 5. Вычисляем оценку коэффициентов: 


—1 
ак =[ АИ и оч ив х 


х [В ("- ПГ [б, 1, +" -П+ос ГУ. (31) 
Шаг 6. Вычисляем выходы моделей: 
у(г) = В("-109(х). (32) 
Шаг 7. Вычисляем остатки моделей: 
и(г) =У-У(”). (33) 
Шаг 8. Вычисляем целевой функционал: 
Ф() = (ии "(ис)". (34) 


ах * 
Этап Ш. Итерационный процесс заканчиваем на итерации г при 
выполнении условия 


9? =Ф(" -1-Ф()< 84, (35) 
где 5% — заданная величина. 


Процедура (22)—(35) является частным случаем итерационных процедур [13] 
и [14], разработанных для оценивания коэффициентов в системах 
авторегрессионных уравнений: первая из них разработана для случая, когда 
ковариационные матрицы случайных составляющих в модели функционирования 
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и модели наблюдения априорно известны, а вторая -— для случая, когда они 
неизвестны. 


Для оценки 4 с учетом (15) и (21) получаем 


а=[(В УВ) ВТУ В0+С8=0+ СЕ. (36) 
С учётом (36) регрессионную модель запишем в виде 
у = у-+и = Ва-+и, (37) 
где у — (их!]) -вектор выхода регрессионной модели 
у=Ва=В0-+ВСЕ=у+В СЕ; (38) 
и — (их1) -вектор остатков [15], для которого выполняется 
и=5-ВС&, Е{щ}=0,, (39) 


Т. е. его математическое ожидание равно нулевому (их 1) -вектору. 


Критерий регулярности МГУА для линейной авторегрессии 
[о о 

Пусть структурная (рхт)-матрица Ж соответствует истинной структуре 
модели объекта (1)—(8), т. е. она однозначно задает структуру авторегрессионного 
уравнения: указывает, какие именно предыдущие значения определяют текущие 
значения выходной переменной. Пусть эта структурная матрица неизвестна и её 
требуется определить по результатам наблюдения функционирования объекта (9), 
т. е. рассмотрим задачу структурной идентификации. Далее будем предполагать, 
что для генерации и анализа структур моделей применяется алгоритм полного 
перебора всех возможных структур моделей, а значение р — число предыдущих 
значений выходной переменной, которые влияют на её текущее значение — 
априорно известно. 

Пусть структурная (рх5)-матрица $ — набор структурных матриц текущей 
анализируемой структуры модели. 

Рассмотрим так называемый Л-функционал качества регрессионного 
уравнения, отражающий требование минимизации математического ожидания 


о ^ (о) ^ 
7=Е{(у-у) (у-У)}, (40) 
который известен для модели одномерной по выходу регрессии [16, с. 172] и 


получил в МГУА название “идеальный внешний критерий” [9, с. 99]. Функционал 

(40) не может применяться при решении практических задач (содержит 
[о 

ненаблюдаемый вектор у), но может быть использован для теоретического 

сравнения методов оценивания, в том числе на основе метода статистических 


испытаний [12]. 
[о 
Существует ли конструктивная альтернатива ненаблюдаемому вектору у в 


/ -функционале (40), сохраняющая для соответствующего функционала свойства 
/ -функционала? Положительный ответ на этот вопрос для систем статических 
(одновременных) регрессионных уравнений [12] получен в рамках так 
называемой схемы повторных наблюдений, которая может быть реализована в 
условиях активного эксперимента. В этой схеме для заданного вектора значений 
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входных переменных объекта производится не одно, а пара независимых 
наблюдения выходных переменных. Первое наблюдение из этой пары участвует в 
формировании выборки А, другое — выборки В, и, в результате, в схеме 
повторных наблюдений выполняется Х(А)=Х(В). 

Такую схему можно реализовать для статических регрессионных моделей, 
но для авторегрессионных моделей она принципиально нереализуема: значение 
каждой из переменных множества Х в силу модели (1) формируется с участием 
случайной ненаблюдаемой составляющей, которую «воспроизвести» нельзя. 
Поскольку добиться выполнения Х(А)=Х(В) невозможно, то остаётся попытка 
обеспечить выполнение 

Х'(4) Х(А) = Х"(В) Х(В) (41) 
и провести исследование критерия регулярности в этих условиях. 

Будем предполагать, что объект, для которого решается задача структурной 
идентификации, принадлежит к классу объектов, допускающих возможность 
неоднократного наблюдения реализаций функционирования (например, 
временные ряды показателей некоторого технологического процесса). И будем 
выбирать такие реализации, которые начинаются с приблизительно одинаковых 
начальных условий х' (4,0) х( 4,0) = х'(В,0) х(В,0), имеют качественно 
одинаковый характер переходных процессов и заканчиваются близкими 
состояниями в конечные моменты времени. 

Пусть в качестве двух выборок наблюдений А и В выбраны наблюдения 
двух реализаций функционирования объекта- две выборки наблюдений 
выходной переменной, обладающих указанными выше свойствами. Первую 
выборку А будем называть обучающей, а вторую В — проверочной. На 
обучающей выборке будем оценивать коэффициенты в авторегрессионном 
уравнении с текущей анализируемой структурой, а на проверочной будем 
оценивать качество построенной модели. (В дальнейшем будем называть такой 
способ формирования обучающей и проверочной выборок «схемой 
квазиповторных наблюдений».). 

В соответствии с (39) для (п(В)х)-вектора остатков на выборке В 


выполняется 
ц(В/ 4,5) = у(В)-у(В| 4,5) = у(В)-В(В,5) 4(4,5), (42) 
где у(В)- (и(В)хП-вектор наблюдений выходной переменной выборки В; 


У(В| 4,5) -— (и(В)хП-вектор выходов регрессионной модели на выборке В, 


^ 
рассчитанный по модели, оценки коэффициентов которой 49(4,5) получены в 
соответствии с (21)-(41) на обучающей выборке А для структуры 5; и(В) — 
объем проверочной выборки. 


В соответствии с (37)-(39) для (п(В)х!-вектора остатков ч(В | 4,5) 
выполняется 
и(В| 4,5) = У(В)+(В)-В(В,5) С(4,5)у(4)- В(В,5) С(4,5)5(4) = 
=5(В| 4,5) +&(В)-В(В,5)С( 4,5) ЕСА), (43) 
где 
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5(В| 4,5) = у(В)-В(В,5)С( 4,5) уса) (44) 
— так называемый (пх1)-вектор смещения, обусловленный выбором структуры 5 
вместо 5. 
Определение 1. Случайная величина 


АВО"(5) = и" (В| А, 5)и(В | А, 5) (45) 
называется критерием регулярности для авторегрессионного уравнения, где 
звёздочка означает тот факт, что выборки А и В получены в условиях 
квазиповторных наблюдений. 


Определение 2. Оптимальным множеством  регрессоров — называется 

множество регрессоров, соответствующее набору структурных матриц 5и: 
5%, =аю шш Е{АКО’"($)}, (46) 
5е5 (р) 
где 5°( р)- множество возможных структурных матриц при заданном параметре 
ре. 

Определение 3. Оптимальным по количеству и составу регрессоров 
называется авторегрессионное уравнение, построенное на множестве регрессоров, 
соответствующем структурной матрице 5%. 

Для математического ожидания АЮО"(5), с учётом результатов [12], 
выполняется 
Е{АКР"(5)} = Е{и'(В| 4,5) (В А,5)} = 
=5 (В|4,5) 5(В | 4,5) +Е {[5'(В)(В)]} 

— Е{8'(В)В(В,5)С(4,5)8(4)} - Е [В(В,5) (А, 5) ЕСА) Е(В)} + 


+ Е{[В(В,5) С(А, ЕСА) ВВ, 5) С(А,5)Е(А)}. (47) 
Для второго слагаемого в (47), с учётом (18)-(20), выполняется 
Е{Е'(ВЕ(В)} =п(В)-(о,+4(0,5)+6), (48) 


а третье и четвертое слагаемые равны нулю, поскольку &(4) и &(В) независимы. 
Для пятого слагаемого в (47), учитывая (17), получаем 
Е{[В(В,5) С( 4,5) (ФТ В(В,5) (4,5) 5(4)} = 
=и[В(В,5) (В ' (4,5); (4,5) "В" (В,5) ]. (49) 
Подставляя в (47) выражения (48) и (49), получаем 
Е{АКО"(5=61(В|А,5)6(В| 4,5) + п(В)- (с: + (0) +65) + 
+и[В(8,5)(В"(4,5);'В(4,5)) В" (В,5)]= 


=А(В| 4,5) +п(В)- (с, +(0,5) +0) +Ш[Р(В| 4,5) ], (50) 

где А(В]| 4,5) — смещение, обусловленное выбором структуры 5 вместо 5: 
А(В| 4,5) =5'(В|4,5)6(В| 4,5); (51) 
Р(В| 4,5) =В(В,5) (В ' (4,5) УХ В(4,5)) "В т(В,5). (52) 
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Исследование критерия регулярности МГУА 


Установим свойства критерия регулярности МГУА (45). С этой целью 
исследуем, как изменяется математическое ожидание критерия в зависимости от 
состава множества регрессоров. В случае истинной структуры получаем 


Е{АЕР"(5)} = п(В)-(, + (0)+06)+ 
+ [В (В, $) (В (А, $) У: (А, $ В (В, $) 1= 
= п(В)- (с, +4 (0,5) +0) + Р(В | А,5)]. (53) 


Случай недостающего регрессора. Рассмотрим случай, когда в текущей 
структуре пропущен один регрессор. Предположим для простоты, что это 
регрессор с номером р, он является максимально удаленным предыдущим 


значением переменной, участвующим в формировании её текущего значения, т. е. 
для структурных матриц выполняется 


$=[$:$], (54) 


где 3 - структурная (рхт)-матрица истинной модели; 3 — структурная 


(рх Е 1))-матрица текущей модели; $ —(рхП-вектор, для которого 
выполняется 
$ = (0,0,..., 0,1). (55) 
Другими словами, в модели функционирования (4) в формировании 


* * 


величины х; участвует величина х:-р ‚, но в текущую модель она не включена. 


[о 
Для матриц регрессоров, соответствующих наборам 5 и 5 в (54), 
выполняется 


в(5)=х$=х[$! $ |=[х$ : Хз |= [В (5): ш |, (56) 
где ш -— (их!) -вектор наблюдений пропущенного регрессора. 


Используя (50)-—(53), вычислим разность математических ожиданий 
[о 
критерия регулярности для текущей структуры 5 и истинной структуры 5: 


А, ($,5) = Е{АВБ"($)}— Е{АВО"($)} = А(В| А,5)+ [Р(В| 4,5) - [Р(В| 4,591, 
(57) 
где А(В| 4,5) =6 (В|А,5)6(В|А,5) - скалярная величина; 5(В|А,5) — 
введенный в (44) (их1)-вектор смещения, обусловленный выбором структуры 5 


[е) 
вместо 5. 


Для вектора смещения 6(В | А,5) выполняется 


5(В| 4,5) =У(В)-В(В,5)С(4,5)У(4) = В(В,5)08-В(В,5) С(4,5) В (4,590 = 


= в(В,5)0-В(В,5) (ВТ (4,5) УЕ ВА, 5) 'ВТ( 4,5) 52 В(4,5)0. (58) 
Запишем (58) с учётом (56) 
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5(В| 4,5) = [В(В,5) : ш(Ву]0— 
-В(В,5)(В'(4,5) 5; В(А,5)) "ВТ (4,5); [В(4,5) } т(А)] 9- 
- [в(В,5) ‘ икВ)@- 


[в(в, 5)'В(В,5)(В"(4,5) 5 В(4,5)) "ВТС, 5) ША) В = 


= ‚„ с ш(В)-Р(В, 4,5) ХЕ ш(А)]0, (59) 
пх(т-П) 
Р(В,А,5)=В(В,5)(В'(4,5);:' В(4,5)) В" (4,5). (60) 
Учитывая (59) и (60) для величины Д(В| 4,5), введённой в (57), получаем 
о о : 0. 

Ес | Ее. И 

А(В| 4,5) =0" и | (ш"(В)-ш" (4) УЕ Р"(В| 4,5) х |0. (61) 
и  :х(ш(В)-Р(В|А,5) ХЕ! ш(А)) 


Для (т,т)-го элемента матрицы в (61) выполняется 
а=(т'(В)-т' (4) ХЕ Р"(В|4,5)) (п(В)-Р(В| 4,5) ХЕ. ш(А)) = 
=ш"(В) и(В)-т'(В)В(В,5)(В (4,5) ХВ (4,5) В"(А,5) ХЕ! (А) - 
-ш"(4)Х: В(4,5)(В" (4,5); 'В(4,5)) В" (В,5) (В) + 
+1" (4) ХВ (4,5) (В (4,5); 'В(4,5)) "ВСВ, 5) х 
хВ(В,5) (В ' (4,5): 'В(4,5)) "В "(4,5) ХЕ ик). (62) 


Далее используем то обстоятельство, что обучающая (А) и проверочная (В) 
выборки получены особым способом как пара реализаций функционирования 
объекта с близкими начальными условиями, качественно одинаковым характером 
переходных процессов и близкими состояниями в конечные моменты времени. 

Введём в рассмотрение разности: 


С(Х)=хХ (В) Х(В)-Х' (А) ХА), (63) 
&(т) =ш" (В) ш(В)- т" (А) (А), (64) 
С(К,5)=В'(В,5) В(В,5)-В' (4,5) В( 4,5), (65) 
с7(К,5)=ш (В) В(В,5)-ш (4) В(4,5). (66) 


(Влияние скаляра (т), вектора 2(К,5), матрицы С(А,5) на условие 
упрощения структуры по числу регрессоров оценены методом статистических 
испытаний в отдельном исследовании.). 

Учитывая (63)—(66), для (62) получаем 


а=т"(А)[М"(4,5) МСА, 5) ] (А) + р: (т), (67) 
где М( 4,5) - (и(А)хи(А)) -матрица 
М( 4,5) =Пиь-В(4,5)(В" (4,5) УЕ В(4,5)) "В" (4,5) ХЕ, (68) 


а для скаляра р, (п) выполняется 
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ри (ша) = 2(т)-5"(К,5)(В'(4,5)Х'В(4,5)) "В '(4,5) ХЕ ш(А)- 
—т" (4) УЕ' В(4,5)(В (4,5); 'В(4,5)) "(8,5 + 
+1" (4) %:'В(4,5)(В (4,5) У: 'В(4,5)) 'С(К,5)х 
х(В '(4,5);;'В(4,5)) "В '(4,5) ХЕ и А) = 
= (т)-8" (8,5) С(4,5) ш(А)-ш" (А) С" (4,5) (8,5) + 
+т'(4)С'(4,5)С(В,5)С(4,5) ш(А). 
Учитывая (54), (67), (68) и соотношение 


0 "= (0;,0>,...,0), 


получаем 
м 0, о 
О ЕО ео ока бе 
т Е т 
0, ‚Ш (4)М (4,5) М(4, 5) ш(А) + ри (т) 
т-—1 


= (05)? -шт(А)НСА, 5) ш(4)+(9*)? рт), 
Н( 4,5) =М"(4,5) МСА,5). 
Итак, в (59)—(72) установлено 


^(В| 4,5) = 5Т(В| 4,5) 5(В| 4,5) = (08°)? шт(А)НСА,5) (4+ (6)? -р! (т). 


Используя (73), для разности (57) получаем 


^, (5,5) =А(В| А,5)+ [Р(В| 4,5) ]- [Р(В| 4,5)]. 


(69) 


(70) 


(70) 
(72) 


(73) 


(74) 


о 
Теперь, продолжая вычисление Д, (5,5), установим разность следов в (74). 


Учитывая (56), получаем 

Р(В| 4,5)-Р(В| 4,5) = 

=В(В,5)(В' (4,5); 'В(4,5)) "В" (В,5)- 
в(В, $ (вт(а, $) х: В(А, $) В (В, $) = 
=В(В,5)[В (4,5) У: 'В( 4,5) "В" (В,5)- 


т 3 а = Ро 
-[8(8,5). О в(4.5)_ В Е Е — 
ш 


ВА ии 


. (15) 


Для перемножения блочных матриц в (75) применим формулу обращения 
блочной матрицы (она является частным случаем формулы Фробениуса [16, 


с. 302]: 
да _[ Ве | Виве у во | вое 
97 е —_ т . атв' ! д 
В нашем случае выполняется 
В=В (4,5) У; В(4,5), е=В'(4,5) ХЕ ш(А), 
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4" =ш" (4) У В(4,5), е=ш" (4): ш(А), (78) 
Х=т" (4)! ш(А)-т" (4); В(4,5)(В"(4,5) 5! В(4,5)) "В" (4,5) 5 ш(А) = 
=ш" (4) ХЕ М(4,5) (А). (79) 


Продолжая (75) и учитывая (76)—(79), получаем 


Р(В, 4,5) - Р(В, А,5) = [В(В,5) : ш(В) 
Ве 
ув О о Иа т т, АЗ ш(А). 7 [о 
Г. щ а В( 4,5) В" | т 
=-/'.В(В, 5) ВВГ (А, 5) ит "(АХ ВА, 5) В "В" (В,5) + 
+/'-В(В,5)В 'В'(4,5) 5.6 (4)6(В)+ 
+Л'.ш(В)ш" (4) У: В(4,5)В "В" (В,5)- Г" .ш(В)ш" (В). 
Учитывая (80), для (75) получаем 

= [Р(В|4,5)- (В 14,5) = - "в ав)- 7 ш"(А)ш(А)+ 
+". 51 (В,5)В "ВТ (4,5); Ш (А) + Г" шт" (А) В(4,5)В "ВТ (4,5) У (А) + 
+1 '-т' (4): 4,5) В '$(В,5) + '-ш (А) ХЕ'В(А,5) В "В" (А, 5)т (А) - 
=’. шт (Е В(4,5)В"С(В,5) ВВ" (4,5) ХЕ ш(А)- 
=. ш"(А) ХВ (4,5) В ВТ (4,5)В(4,5)В "В" (4,5)! (А) = 

=-Л '-ш"(4)Н(4,5) ш(А)- Г 4), (81) 
где Н(4,5)=М'(4,5)М(4,5); М(4,5)- (и(А)хп(А)) -матрица введена 
в (67)—(68); а для скалярной величины 4(т) выполняется 
4(т) = (т) 8" (®)В "В "(4,5)Х' ш(А) — ш" (А) ХЕ В(А,5) В '8(®)+ 
+т'(4);:'В(4,5)В'С(В)В "В" (4,5) 5х (А) = 
= (т)-5'(К)С(4,5) ш(А)-шт'(4)С' (4,5) 5" (В) + 

+т'(4)СТ(4,5)С(®)С(4,5) ш( А. (82) 
Подставляя (81) в (74), получаем 
4,(5,5) = (@#)? -ш"(4)Н(Я, 9) (49+ (98)? рт) 
-Л'-ш' (4) НС, 5) (А) — Г" 4 (т). (83) 


Если 4! (5,5) > 0, то структура 5 лучше 5; если 4! (5,5) < 0, то структура 5 


(80) 


лучше 5; если 4 (5,5)=0, то структура 5 лучше 5 по дополнительному 


о 
принципу простоты. Выполнение Л,(5,5)<0 является условием так называемой 


редукции (упрощения) модели, оптимальной по структуре. Из (83) для условия 
редукции получаем 
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(9%)? -ш'(4)Н(4,5) ш(4)+ (95)? -ри(т) < 
</'-ш'(4)Н(4,5) ш(А) + Г" - 4), (84) 
Н(4,5) - (п(А)хп(А)) -матрица введена в (72); р. (т), Г и а(м) - скалярные 
величины определены в (69), (79) и (82) соответственно. 
Исследование степени влияния скалярных величин р (т) и 4(т) на 


условие редукции (84) в условиях схемы квазиповторных наблюдений, 
проведённое методом статистических испытаний, показало, что этими 
величинами можно пренебречь. Тогда условие редукции с учётом (79), принимает 
вид 


(65 шт (4) УЕ МСА, 5) т 4) <1. (85) 


Из (85) следует, что возможность редукции модели может быть обусловлена 


[о 
четырьмя причинами: а) малостью нормы коэффициента 0»; 6) малостью нормы 
вектора наблюдений регрессора т(А); в) малым значением квадратичной формы 
тт (А) р: МСА, 5) ш( А) ; г) малым объёмом выборок наблюдений и(В). 


Редукция модели, оптимальной по составу регрессоров, означает, что при 
выполнении соотношения между параметрами модели (85) следует исключить 
регрессор ш из модели. Редуцированная (упрощённая) модель будет иметь 
меньшую ошибку прогнозирования выходной переменной на новых выборках по 
сравнению с моделью, построенной на истинной структуре. 

Случай избыточного регрессора. Рассмотрим случай, когда в текущую 
структуру включен излишний регрессор. Предположим для простоты, что это 
регрессор с номером р, он является максимально удаленным предыдущим 
значением переменной и не участвует в формировании ее текущего значения, т. е. 
для структурных матриц выполняется 


$ =1[5 |5], (86) 
где $ - структурная (рхт)-матрица истинной модели; $ -— структурная 
(рх(т-+1)) -матрица текущей модели; $ — (рх!)-вектор 

$ = (0,0,..., 0,1)". (87) 
Другими словами, в модели функционирования объекта (4) в формировании 
х(Р) не участвует величина х:-р(й), но в текущую модель она включена. 


Используя (50)-(53), вычислим разность математических ожиданий 
[о 
критерия регулярности для текущей структуры 5 и истинной структуры 5: 


^, (5,5) = Е АВР"(5)- Е{АВР"($) = 
-А(В| 4,5) 8 [Р(В| А, 5)]- "[Р(В| 4,53]. (88) 


В случае избыточного регрессора величина Д(В|А,5) в (50) является 


нулевой. Для доказательства этого факта достаточно показать, что вектор 
смещения 6(В|4А,5) для случая избыточного регрессора является нулевым. 
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Действительно, различие в структурных матрицах (86)-—(87) приводит к 
выполнению: 


в(5)=Х5=Х[5$|$1=[Х$ Хз] = [В(5) 11, (89) 
где г — (их|) -вектор наблюдений избыточного регрессора. 
Для вектора смещения 6(В|4А,5) в случае избыточного регрессора 
выполняется 


5(В| 4,5) = (В)-В(В,5)С(4,5)у(4) = В(В,5)0-В(В,5)С(4,5)В(4,5)0 = 


-в(В, 598 —[В(В,5) : г(В)]х 


::] 
х а ини а к (90) 
г` (4) 


ГГ (А 


Вычисляя аналогично (58)—(73), получаем 6(В| 4,5) =0и А(В| 4,5) =0. 


Для случая избыточного регрессора, аналогично (75)—(82), получаем 
&[Р(В| 4,5) -Р(В| 4,5) = 
= ($) -"(МТ (А, МСА, 5) (4) + ($47). (1) 
Дб) = ТА) А)-2Т(4) 52 В($)(ВТ(5) 52 В(5)) ВТ(5) кА) = 
=т(4) 57 МСА, 5) (А) (92) 
— положительная величина, поскольку матрицы >. и М(4,5 ) положительно 


определены; М(А,5) —(ихп) -матрица аналогична (67)—(68); г(А)- (их|- 
вектор, определённый в (89); для скалярной величины 4(г) выполняется 


(г) = «(к - 8” (ЮВОАТ(А, 5) (А) (АЕ ВС, 5) В78(®) + 
+" (А) ЕВС, $) В 'С(Ю)В”В (4, $) ХЕ к(А). (93) 
Учитывая (91), пренебрегая влиянием / $ )-а9 (г), получаем 
А, (5,5) = Г (5)-кТ(А)НС А, 5) г(4)>0, (94) 
где матрица Н(А, $ = мт (А, $ МСА, $ ) —- положительно определена, а величина 
5 -1 (5 ) положительна, поэтому величина (94) положительна. Из (94) следует, что 


о 
в случае избыточного регрессора истинная структура 5 всегда лучше структуры 


5 ‚ а регрессор г действительно не следует включать в модель. 


120 СА.П. Сарычев 


155М 1561 - 5359. Штучний 1нтелект, 2015, № 3-4 


Заключение 


По принципам метода группового учета аргументов построен и исследован 
критерий регулярности для моделирования в классе авторегрессионных урав- 
нений в условиях квазиповторных наблюдений. Получены условия существо- 
вания оптимального множества регрессоров, зависящие от коэффициентов 
моделей, матриц наблюдений регрессоров, дисперсии случайных составляющих и 
объемов выборок. Выявлены закономерности редукции (упрощения) оптимальной 
регрессионной модели. Редуцированная модель будет иметь меньшую ошибку 
прогнозирования выходной переменной на новых выборках по сравнению с 
моделью, построенной на истинной структуре. 
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КЕ$ОМЕ 
А.Р. Загуспеу 


Глпеаг Аибогеоге$$\оп Вазед оп Фе Сгопр Мефо@Я ог Оаа НапдИпо т 
Сопаоп$ о? Оцпазгережед ОЪзегуаНоп$ 

Реепитайоп оЁ Фе ог4ег оЁ ашогеотезюп то4е! ш сопд1оп$ оЁ згасвага1 
ипсецатшеу Бу даапЫеу ап@ збгасфиге оР теотеззотз$ 15 Фе пироцапё ргоМет ш Ше 
Феогу оЁ 14епийсайоп. ш бе Отоир Метод ог Райа НапаПпе а тодейп® ш е с1аз$ 
ОР ащюогеотез1оп едиайоп$, Ше стцепоп оЁ тезщагиу 15 наопаПу аррПеа4. Тгаие 
затр/е 15 Ююгте4 Бу Ше ЁЙг5ё и(А) обзегуаНоп$ ап4 {1езЯпе затрИе 1$ Юогте4 Бу Ше 


забзедиепе и(В) обзегуайоп, ап4 и 15 сагле4 ойё и(А)-+ (В) =п, \Теге п 15 уоате 


оЁ па| затр!е. АррИсайоп оЁтезиагиу стиепоп ш засВ Кша детап4$ Ве сопёго| а$ 
4упатис ргорегйез оЁ обес сап Ъе зВо\уп ипедиаПу оп @1егепе рБазез оЁ тапзлеп в. 
ш 115 рарег, Ше теощагиу стйепоп ш Фе зо-саЙе@ зсВете оЁР адаазтережеа 
обзегуанНоп$ Ша#й 15 роз51Ые ш соп@!юоп$ ог асйуе ехрегитепе 1$ оЁегеа. ш 1$ 
зсНете Ше ташше (А) ап4 1ез пе (В) затр[ез аге гесауе4 Бу зресла! \ау аз рат 
геаПптайот$ оЁ исНопше оЁ оБ]есё ул с1озе ша[ соп41оп$, апаайуе[у 14епйса1 
свагасег оЁ тапз1еп $ ргосез$ ап4 с1озе соп@оп$ иги е Ипа! поте оРите. 

Г: 15 ргоуед, па Фе орйплит $е{ оЁ теотеззотг$ ех155. Тре соп4 1 оп оЁа гедисйоп 
оЁ Фе орИтит амюгеотез$1оп тоде] 15 оатеа. 'ТЬ1$ соп@ оп 4ереп4$ оп рагатеегз 
ОР ащогеотез$оп то4е!| ап уоцитез оЁ затр!ез. Те тефисе4 то4де! Ш Вауе а 
зтаПег питзаКе оЁ ГогесазИп» оРа ошри! уамае оп пе\ затр[ез оЁ обзегуайоп$ ш 
сотраг15оп у тоде| {ва{ сопзгасе4 оп гие згасйте. 
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А.П. Сарычев 


Линейная — авторегрессия на основе метода группового учёта 
аргументов в условиях квазиповторных наблюдений 


Определение порядка авторегрессионной модели в условиях структурной 
неопределённости по количеству и составу регрессоров является важной задачей 
в теории идентификации. В методе группового учёта аргументов при 
моделировании в классе авторегрессионных уравнений традиционно применяется 
критерий регулярности: обучающая выборка формируется первыми и(А) 


наблюдениями временного ряда, проверочная выборка последующими п(В) 
наблюдениями, причём выполняется п(А)-+и(В)=п, где п — объём исходной 


выборки. Применение критерия регулярности в таком виде требует контроля, 
поскольку динамические свойства объекта могут проявляться неодинаково на 
разных фазах переходных процессов. В данной работе предлагается рассчитывать 
критерий регулярности в так называемой схеме квазиповторных наблюдений, 
которая возможна в условиях активного эксперимента. В этой схеме обучающая ( 
А) и проверочная ( В’) выборки получены особым способом как пара реализаций 
функционирования объекта с близкими начальными условиями, качественно 
одинаковым характером переходных процессов и близкими состояниями в 
конечные моменты времени. 

Доказано существование оптимального множества регрессоров. Получено 
условие редукции оптимальной авторегрессионной модели, которое зависит от 
параметров авторегрессионной модели и объёмов выборок. Редуцированная мо- 
дель будет иметь меньшую ошибку прогнозирования выходной переменной на 
новых выборках наблюдений по сравнению с моделью, построенной на истинной 


структуре. 
Поступила в редакцию 15.06.2015 
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